# -*- coding:utf-8 -*-

import docx
from docx import Document
from docx.shared import Inches
import re

"""
import install python-docx
将doc转为docx
from win32com import client as wc
word = wc.Dispatch("Word.Application")
doc = word.Documents.Open(路径+名称.doc)
doc.SaveAs(路径+名称.docx, 12)   # 12为docx
doc.Close()
word.Quit()
"""

document = Document('test.docx')  #打开文件demo.docx
# 读word文本内容
for paragraph in document.paragraphs:
    print(paragraph.text)  #打印各段落内容文本

tables = document.tables #获取文件中的表格集
table = tables[0]#获取文件中的第一个表格
#行列个数
row_count = len(table.rows)
col_count = len(table.columns)

for i in range(0, len(table.rows)):#从表格第二行开始循环读取表格数据
    result = table.cell(i, 0).text + "" + table.cell(i, 1).text
    #cell(i,0)表示第(i+1)行第1列数据，以此类推
    print(result)
